草庐IT

Java CLI 解析器

全部标签

xml - Python2 sax 解析器,大文件的最佳速度和性能?

所以我一直在使用suds来使用web服务,它有很大的好处。遇到性能问题,对于某些数据,cpu会急剧上升,需要60多秒才能完成请求,由gunicorn服务,suds到webservice等。使用line_profiler、objgraph、memory_profiler等进行调查,我发现罪魁祸首是大约需要13秒来解析一个9.2mb的xml文件,这是来自网络服务的响应。这不正常吧?只有9.2mb,我看到99%的时间都花在了解析上,解析是通过“fromxml.saximportmake_parser”完成的,这意味着标准python?有没有更快的大文件xml解析器?我会仔细研究XML中的结构

java - Spring 不解析类路径 : in the file declaration in xml

我在解析spring的“classpath:”特性时遇到了问题。我的文件在下一个路径中:src/main/java/resources/FederationMetadata.xml此外,我还有一个bean:classpath:FederationMetadata.xml所以我的问题是应用程序失败并出现下一个异常:D:\myFolder\myProject\classpath:FederationMetadata.xmldoesnotexist据我了解,Spring不会解析文件位置。我尝试使用classpath*:,但没有帮助。在另一个项目中,我有相同的设置(使用“类路径:”)并且工作正

xml - 将 XML 解析为 R 数据帧

我一直在尝试将一个大的xml文件解析为一个R-data.frame对象。xml具有以下架构:plyr便利函数没有帮助,因为无法验证xml。所以我想出了以下代码,使用xpath查询:adHocXml该代码完全符合我对短文件的预期。然而,对于一个大文件和几千行标签,大约10分钟后我收到以下错误:Error:1:internalerror:Hugeinputlookup2:Extracontentattheendofthedocument谁能帮帮我? 最佳答案 libxml对单个节点的大小有上限。您可以通过启用解析器标志XML_PARSE

java - DOM 解析器错误的 childNodes 计数

这很奇怪,但让我尽力把它说清楚。我有一个XML,我正在通过正常方式从桌面读取它并通过DOM解析器解析它。0abcAppabcWallet11Ss22AddingNewcake读取XML以获取child。Documentdoc=docBuilder.parse("C://Users//Desktop//abc.xml");Noderoot=doc.getElementsByTagName("Abase").item(0);NodeListlistOfNodes=root.getChildNodes();//SysoutPrints13所以我的逻辑在这里运作良好。当我尝试通过将相同的XML

javascript - 使用 Jquery 解析 XML 数组

我遇到了使用Jquery传递XML的问题。我在遍历jquery时得到空数组。请帮助我如何从XML数组中获取数据。我在下面提到了我的代码。XML999GIZAMIDINSURANCEANDSERVICESPVTLTDnullASHRIVENGATESHnullA1PROCESSnullAAAENTERPRISESnullAALAGUSUNDARAMnullJquerypage_response=getResponse("yyyURL");page_response.success(function(data){console.log(data.results[0]);console.lo

Java:如何将 XML 流拆分成小的 XML 文档?流式 XML 解析器上的 XPath?

我需要从网络上读取一个大的XML文档并将其拆分成较小的XML文档。特别是我从网络上读取的流看起来像这样:................我需要把它分成几block...(我实际上只需要....部分,只要声明更高的命名空间绑定(bind)(例如在中)移动到如果这样更容易)。该文件对于DOM样式解析器来说太大,必须进行流处理。是否有任何XML库可以执行此操作?[编辑]我认为我理想中寻找的是能够在XML流上执行XPath查询的能力,其中流解析器仅在必要时解析以返回结果节点集中的下一个项目(及其所有属性)和child)。不一定非要是XPath,而是符合这个想法的东西。谢谢!

xml - maven 和 xml 解析的 Hibernate 依赖问题

我正在为我们的开发团队编写GWT-Hibernate内部Web应用程序。之前,我编写了工具来解析XML文件,这些文件表示在现场收集的客户配置以供分析。现在,我正在尝试为支持组添加一个UI前端。XML解析代码使用xpath和org.w3c.dom类来使用配置文件,在将UI和解析代码合并到同一个项目后,我遇到了依赖性问题。Hibernate3.5.1依赖于使用旧版本xml-apis的dom4j。xml-apisjar有旧版本的org.w3c.dom类,太旧以至于我在XML解析中使用的方法之一不可用。org.w3c.dom.Node.getTextContext方法在旧的xml-apis类中

xml dtd-如何避免解析元素的内容?

在构成我的xml的元素中,我有一个元素,我们称之为“X”,它可以包含许多不同类型的内部元素。因此,我想定义DTD解析器以避免在其XMl验证期间解析其内容。我试图通过以下方式定义此元素:并收到错误消息,指出“X”内的内部元素未定义并尝试将其定义为:我收到错误消息“‘X’内只允许文本”我应该如何定义X以便DTD验证器忽略元素“X”的内容? 最佳答案 Internet上的某些指南声称ANY表示关闭此元素的验证过程,但这不是正确的信息。DTD中的内容模型ANY实际上并不意味着“允许此元素中任何格式良好的XML内容”。相反,它意味着“允许在此

xml - 当文件具有 xmlns 属性时在 F# 中解析 xml

所以我尝试使用F#XMLparsingpost在以下xml中(来自uclassifyAPI):代码是这样的:letdoc=Xdocument.Loadfiledoc.Element(xn"uclassify").Element(xn"readCalls").Element(xn"classify").Element(xn"classification").Element(xn"class").Attribute(xn"p")这行不通!!!似乎无法完成解析。然而,删除属性xmlns="http://api.uclassify.com/1/ResponseSchema"version="1

java - 在 xml 文件中使用 CDATA 来解析 html 数据

我有一个xml文件,其内容中包含格式错误的HTML..由于xml无法解析之类的html标签我使用CDATA进行保存和解析。我使用了documentBuilder.setCoalescing(true);在解析以恢复数据时testdata]]>没有CDATA标签..但是在optput中标签被<and>代替了分别..我期待这个字符串的结果......testdata在解析后的字符串中。如何做到这一点?任何的想法?提前致谢!更新:我还有两个问题正在跟进..1.有什么方法可以通过代码将格式错误的HTML(例如)转换为可解析的xml(例如),如果可以,它会处理 吗?还有吗?